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Proced£ de production d'une proteine recombinante 
d'interet et proteine produite, 

L' invention a pour objet un nouveau procede de 
5 production de proteine d'interet, en grande quantite, 
directement utilisable pour des analyses structurales . 
L' invention concerne egalement la proteine recombinante 
obtenue . 

Les recepteurs couples aux proteines G (RCPGs) 
10 constituent une super-f ami lie de proteines membranaires 
caracterisees par 7 domaines transmembranaires (TM I a VII) 
qui jouent un r61e primordial dans la communication 
intercellulaire et la reception des signaux sensoriels [1] . 
Avec plusieurs centaines de membres identifies, les 
15 RCPGs constituent la famille structurale et f onctionnelle 
de recepteurs membranaires la plus importante. lis 
representent notamment une part significative du genome 
humain connu a ce jour (au moins 700 recepteurs, 0.5 % du 
genome) . 

20 Exprimes H la surface de toutes les cellules d'un 

drganisme (de la levure a 1'homme), ils sont actives par 
une tres grande vari^te de messages extracellulaires 
(peptides, hormones, lipides, molecules odorantes, lumiere, 
nucleotides, nucleosides, molecules du gout, etc...). Leur 

25 activation entraine une cascade intracellulaire de signaux 
par 1' interm^diaire de proteines G et resulte en un grand 
nombre de reponses cellulaires (par exemple division ou 
contraction cellulaire, neurotransmission) . 

De fagon generale, les RCPGs sont impliques dans 

30 chaque fonction physiologique . L' importance de ces 
recepteurs ainsi que la connaissance de leur localisation 
cellulaire les designe comme des cibles ideales de la 
therapeutique . Et ef f ectivement , on peut estimer que pres 
de 50% des medicaments sur le marche agissent via les 



WO 2004/113539 PCT/FR2004/001538 

2 

RCPGs. Beaucoup de pathologies sont la consequence de 
mutations des RCPGs, et leurs manifestations cliniques sont 
bien connues, on peut citer par exemple cecite, diabdte 
insipide nephrogenique, hypo- ou hyperthyroidisme, puberte 
5 precoce, ob£site [2] . 

La decouverte que certains recepteurs des chemokines 
sont des cofacteurs de 1' infection par le virus HIV 
renforce 1 ' idee que les RCPGs sont impl iques dans une 
grande variete de situations pathologiques [3] . 

10 Ces considerations generales indiquent clairement la 

necessite d'etudier 1 ' architecture f onctionnelle de ces 
recepteurs, afin de mieux comprendre le processus de 
transduction du signal et la dynamique de leurs 
interactions avec diverses molecules (ligands ou 

15 partenaires intracellulaires) , ainsi que pour developper de 
nouveaux outils pharmacologiques et therapeut iques . 
Cependant, 1' etude de 1 ' architecture f onctionnelle des 
RCPGs par les methodes experimentales « directes » 
(cristallographie aux rayons X, RMN, spectrometrie de 

20 masse) reste encore trds limitee. Une seule structure 
tridimensionnelle (3D) est actuellement connue, celle de la 
rhodopsine de boeuf [4] , du fait du tres fort niveau 
d' expression naturel de ce rgcepteur dans la retine. La 
connaissance de leur architecture f onctionnelle est done 

25 abordee actuellement par un faisceau de methodes theor iques 
(modelisation) , physico- chimiques (photomarquage , 
fluorescence) et biologiques (mutagenese dirigee, 
pharmacologic moleculaire, knock-out, etc. . *) . 

Ces etudes representent un enjeu industriel et socio- 

30 economique de premiere importance, compte tenu des 
applications therapeutiques potentielles . 

Cependant 1' etude structurale et f onctionnelle des 
RCPGs est tres difficile pour diverses raisons : 
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- la nature transmembranaire de ces proteines et leur 
caractere hydrophobe rendent leur manipulation delicate et 
conduisent en general a une perte de la fonctionnalite et a 
une denaturation apres solubilisation ; 

5 - les obtenir dans la totality de leur sequence 

primaire reste tres difficile. La plupart du temps, ils 
sont exprimes sous forme tronquee [5] . 

- ils sont exprimes en quantite tres faible (0.01% 
des proteines membranaires) ce qui constitue un blocage a 

10 leur purification en grande quantite ; 

- leur poids moleculaire est eleve (superieur a 40 
kD) , et ils sont caract£rises par la presence de 
modifications post - traductionnel les (glycosylat ion, 
palmitoylation, phosphorylation) et de traits structuraux 

15 particuliers (ponts disulfure) ; 

- ce sont des proteines multif onctionnelles possedant 
des domaines avec des roles differents : liaison des 
ligands, activation des proteines G, sites allosteriques, 
zones impliquees dans leur regulation / desensibilisation 

20 0n comprend aisement que l'etape critique qui 

constitue actuellement un r£el blocage est certainement 
celle de l'obtention des RCPGs en des quantites compatibles 
avec les approches de biologie structurale « directes ». 

Jusqu'a present, aucune strategie de production en 

25 grande quantite, general isable a tous les RCPGs, permettant 
en outre leur purification sous forme f onctionnelle d'une 
maniere simple, n'a ete mise au point. Ponctuellement , 
certains recepteurs ont ete produits en quantite elevee 
(mg/1 de culture) [6-8] , mais les methodes mises en place 

30 ne s'appliquent pas a une majorite de RCPGs. 

Les RCPGs ne representent dans ce domaine de la 
production en grande quantite d'une proteine qu'un exemple 
des difficultes que l'on rencontre lorsqu'il s'agit 
d'obtenir une quantite importante d'une proteine d'interet. 
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La presente invention a pour but de fournir un proceed de 
production en grande quantite d'une protgine d'interet, 
particulierement des RCPGs. 

Les inventeurs ont de maniere surprenante # montre que 
5 la construction de proteines recombinantes, 
particulierement de proteines membranaires , tres 
particulierement de RCPGs, comprenant au moins un fragment 
d'une integrine alpha et la prot£ine d'interet, permet 
d'obtenir des proteines recombinantes pouvant etre 

10 exprimees en grande quantite. Cette stratggie permet en 
particulier d'obtenir une production desdites proteine en 
grande quantite dans des microorganismes, particulierement 
dans des bacteries. Lorsque les proteines recombinantes de 
1' invention sont produites dans des bacteries, elle 

15 s'accumulent dans les corps d' inclusion du cytoplasme 
bacterien. Il est alors necessaire de renaturer les 
proteines d'interet pour les obtenir sous forme active en 
une quantite compatible avec une analyse directe de leur 
structure par exemple par cristallographie aux rayons X ou 

20 par resonance magnetique nucleaire (RMN) . Le procedS de 
1' invention peut permettre en outre la production de 
proteines non tronquees, particulierement lorsqu'il est 
applique aux RCPGs . 

Les integrines forment une famille de recepteurs lies 

25 structurellement et f onctionnellement qui participent aux 
interactions cellule-cellule et cellule-matrice extra- 
cellulaire. Toutes les integrines se presentent sous forme 
d' het<§rodimeres de sous-unites alpha et beta, liees de 
maniere non covalente. Sur la base de leur sequence 

30 primaire, toutes les integrines alpha presentent une region 
N-terminale const ituee de sept sequences en acides amines 
repetees (repetition I a VII) , chacune comprenant 
approximativement 60 acides amines. Certaines sous-unites 
alpha incluent un domaine d' insertion (domaine-I) d' environ 
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200 acides amines, situ<§ entre les repetitions II et III. 
Les homologies entre les repetitions I et VII comprennent 
essentiellement des sequences consensus FG et GAP , 
correspondant aux enchainements phenylalanine, glycyl- 
5 glycyl, alanyl, prolyl, d'oti leur denomination « repetition 
FG-GAP ». 

A la connaissance des inventeurs, la sous -unite alpha 
des integrines (par ailleurs appelee integrine alpha 
(integrine a) dans le texte) n'a jamais ete utilisee pour 

10 la production de proteines recombinantes d'interet dans des 
cellules autres que des cellules de mammiferes et ce en 
quantite directement compatible avec une analyse 
structurale de la proteine d'intergt, ce qui necessite une 
quantite de ladite protiine pouvant aller jusqu'a plusieurs 

15 milligrammes. 

La presente invention vise a satisfaire cette 
exigence . 

Ainsi, 1' invention a pour objet premier 1 ' utilisation 
d'au moins un fragment d'une integrine alpha dans la 

20 construction d 7 au moins une proteine recombinante 
d'interet. L 7 invention a aussi pour objet 1 ' utilisation 
d'au moins un fragment d'une integrine alpha pour la 
production d'au moins une proteine recombinante d'interet. 
Dans le present texte, I 1 expression "proteine 

25 recombinante" ou "proteine recombinante d'interet" se 
rapporte a la proteine recombinante produite selon 
l f invention. Cette proteine recombinante peut en 
particulier comprendre 1 ■ enchainement de plusieurs (au 
moins deux) proteine d'interet, fusionnees, <§ventuellement 

30 separees par des sequences espaceurs et/ou des sequences 
de clivage. 

L 1 expression "proteine d'interet" se rapporte a la 
sequence peptidique correspondant a une proteine d'interet 
que l'on veut produire (ou que l'on a produite) . 
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Ainsi, l ! on comprend qu'une "proteine recombinante" 
est constitute d'une ou plusieurs "proteine d'inttret" 
eventuellement separees par des sequences espaceurs et/ou 
des sequences de clivage. 
5 Par fragment d'une int6grine alpha, on entend aussi 

bien la sequence en acide amine complete de l'integrine 
alpha utilisee qu'une sequence partielle. La sequence de 
l'integrine alpha utilisee peut etre native ou mutee. 
Preferentiellement selon 1' invention, la sequence utilisee 

10 est une sequence comprenant l'extremite N-terminale de 
l'integrine alpha utilisee, encore plus preferentiellement 
une sequence correspondant a l'extremite N-terminale de 
l'integrine alpha utilisee. 

Selon un mode particulier de 1' invention, le fragment 

15 de l'integrine alpha utilisee comprend au moins les modules 
FG-GAP IV a VII et une portion du module FG-GAP III de 
l'integrine alpha utilisee. 

Le fragment de l'integrine alpha utilisee peut etre un 
fragment de toute integrine alpha connue . On citera 

20 particulierement les integrines ocl, a2, cc3, <X4, a5, as, 
oc7, a8, oc9, alO, an, aD, aE, aL, ocM, ocX, alib ou encore 
av. 

Selon un mode de realisation particulier de 
l f invention, on utilise un fragment de 287 acides amines, 

25 correspondant a la partie de l^xtrimite N-terminale de 
l'integrine alpha 5 qui s'etend entre les positions 231 et 
517, selon la numerotation tenant compte de la presence du 
peptide signal. Si 1 1 on ne tient pas compte du peptide 
signal, le fragment utilisable dans 1' invention s'etend des 

30 positions 190 (residu G) a 476 (residu G) de l'integrine 
alphas . 

Lorsque 1 • on utilise d'autres integrines alpha, les 
fragments utilisables selon 1' invention sont les fragments 
homologues aux fragments ci-dessus definis. Par exemple 
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quand il s f agit de 1 1 integrine aV, le fragment utilisable 
selon 1» invention correspond a la partie de l'extremite N- 
terminale de 1 1 integrine aV qui s 1 etend des positions 211 
(residu G) a 495 (residu G) selon la numerotation tenant 
5 compte de la presence du peptide signal. Si 1 ' on ne tient 
pas compte du peptide signal, le fragment utilisable dans 
1' invention s 1 etend des positions 181 (residu G) a 465 
(residu G) de 1 1 integrine aV. Quand il s'agit de 
1' integrine allb, le fragment utilisable selon 1' invention 

10 correspond a la partie de l'extremite N-terminale de 
l f integrine allb qui s' etend des positions 224 (residu G) 
a 508 (residu Q) , selon la numerotation tenant compte de la 
presence du peptide signal. Si l ! on ne tient pas compte du 
peptide signal, le fragment utilisable dans 1' invent ion 

15 s' etend des positions 193 (residu G) a 477 (residu Q) de 
1* integrine allb. 

Selon un mode particulier de 1' invention, le fragment 
de 1' integrine alpha utilisee comprend au moins une 
sequence en acides amines choisie parmi les sequences SEQ 

20 ID n°l (fragment de 1 1 integrine OS humaine) , SEQ ID n°2 
(fragment de 1' integrine V humaine) et SEQ ID N°3 (fragment 
de 1' integrine allb humaine), de la liste de sequence 
fournie en annexe. 

Selon un autre mode particulier de 1' invention, le 

25 fragment de 1' integrine alpha utilise comprend au moins une 
sequence en acides amines cod€e par l'une des sequences en 
nucleotides, choisie parmi les sequences SEQ ID N°4 
(fragment de 1' integrine a5 humaine), SEQ ID N°5 (fragment 
de 1' integrine V humaine) et SEQ ID N°6 (fragment de 

30 1' integrine allb humaine), de la liste de sequence fournie 
en annexe. 

Selon encore un autre mode de realisation particulier 
de I 1 invention, il est possible que le fragment de 
1' integrine alpha soit utilise dans la construction de 
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plusieurs (au moins deux) proteines d'interet 
recombinantes . Dans ce cas, les proteines recombinantes 
seront fusionnees lors de la traduction. Cela peut s'averer 
necessaire dans le cas d ! une proteine d'interet pour 
5 laquelle la construction selon 1 1 invention ne permet pas sa 
production directe (proteine refractaire) . II est alors 
necessaire de coupler en tandem la sequence de ladite 
proteine refractaire a une proteine recombinante d'interet 
que les constructions selon 1 ! invention permettent de 

10 produire. Ainsi, selon cette forme particuliere de 
realisation de l f invention, la construction selon 
1' invent ion comprendra au moins un fragment d'ADN codant au 
moins un fragment d'une integrine alpha, puis au moins un 
ADN codant au moins une premiere proteine recombinante 

15 d'interet et au moins un ADN codant au moins une seconde 
proteine recombinante d'intSret. Selon ce mode de 
realisation particulier de 1' invention, 1 1 ADN codant la 
seconde proteine d'interet sera insert dans la construction 
en phase en aval de la sequence d 1 ADN codant la premiere 

20 proteine d'interet. Ce mode de realisation particulier peut 
etre combine a I'un quelconque des modes de realisations 
particuliers decrits precedemment . 

Pref erentiellement selon 1' invention, le fragment 
d' integrine alpha est situe dans la proteine recombinante 

25 d'interet preparee selon 1' invention, en amont de la 
sequence de la proteine d'interet (ou des sequences des 
proteines d'interet) que l'on vise a produire, c'est-a-dire 
du cote N-terminal de la proteine recombinante d'inter§t 
(ou des proteines recombinantes d'interet) que l'on cherche 

30 a construire et/ou a produire. 

L' invention a egalement pour objet une proteine 
recombinante caracterisee en ce qu'elle comprend, 
fusionnes, au moins un fragment d'une integrine alpha tel 
que defini precedemment et au moins une proteine d'interet. 
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La (ou les) proteine (s) d'interet, partie(s) de la 
proteine recombinante de 1' invention, peut etre toute 
proteine que l'on cherche a produire, particuli^rement une 
proteine membranaire, tres particuli£rement un recepteur 
5 couple aux proteines G (RCPGs) . A titre d'exemple pour ces 
derniers, on peut citer les recepteurs de la vasopressine 
et de l'ocytocine (Via, V2 , OTR) , les recepteurs des 
leucotrignes (BLT1, BLT2, CysLTl, CysLT2) , les recepteurs 
adrenergiques (beta 3), les recepteurs canabinoides (CB1) , 
10 les recepteurs des chimiokines (CCR5, CXCR4) le recepteur 
ATI de 1 ' angiotensine II, le recepteur B2 de la 
bradykinine . 

La proteine recombinante de 1' invention (quel que soit 
le mode de realisation de l 1 invention) peut en outre 

15 comprendre toute sequence en acides amines qui permet de la 
purifier de maniere aisee. Ainsi selon un mode particulier 
de 1' invention, la proteine recombinante peut comprendre 
une sequence de 6 residus histidine (tag 6xHIS) . Ce tag 
6xHIS peut etre incorpore dans la sequence de la proteine 

20 en vue de sa purification sur colonne de Ni-NTA (Nickel- 
nitrilotriacetic acid) agarose. Pref erentiellement , cette 
sequence est a l'extremite C-terminale de la proteine 
recombinante de 1' invention. Lorsque la proteine 
recombinante selon 1 1 invention est constitute d f au moins 

25 deux proteines fusionnees, le tag 6xHIS est 
pref erentiellement situ£ en aval de la derniere des 
proteines d'int6r§t que l'on cherche a produire. 

La sequence codant la proteine recombinante peut en 
outre comprendre au moins une sequence codant au moins un 

30 site de clivage par une endoprotease. 

De manidre avantageuse, la sequence codant pour les 
derniers residus de l'integrine peut £tre mutee pour 
constituer un site de clivage pour une endoprotease 
(facteur Xa, thrombine) , qui permettra apres expression et 
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purification de la proteine recombinante, de separer la 
proteine d' interet de son partenaire de fusion. Selon une 
forme de realisation particuliere de l 1 invention, le residu 
L (position 285) peut §tre modifie par mutation en un 
5 residu I, les residus E et G (positions 286 et 287) etant 
conserves. Un residu R supplementaire peut etre introduit 
par mutagenese. L 1 enchainement ainsi constitue (IEGR) 
correspond au site de clivage par le facteur Xa qui coupe 
la proteine aprds le residu R. 

10 Sous une autre forme de realisation, le site de 

clivage au facteur Xa peut §tre transforme en un site de 
clivage a la thrombine. Pour cela les residus I, E, et G 
peuvent etre remplaces par des residus L, V et P. Le residu 
R est conserve afin d ! obtenir 1 1 enchainement LVPR. Comme le 

15 fragment integrine a ete incorpore dans le vecteur cote 3" 
par un site BamHl (sequence ggatcc) , on obtient done la: 
sequence ggatcc codant pour deux residus G et S juste apres 
LVPR. L 1 enchainement LVPRGS constitue le site de clivage a 
la thrombine, qui coupe la proteine apres le residu R. 

2 0 On comprend done que dans une forme plus elaboree, la 

proteine recombinante de 1' invention comprend, de son 
extremite N-Terminale a son extremite C-Terminale, le 
fragment d' integrine alpha comportant le site de clivage 
par une endoprotease, la (ou les) proteine (s) d' interet et 

25 le tag 6xHIS. 

Sous une forme particuliere, la proteine recombinante 
de 1' invention comprend, de son extremite N-Terminale £ son 
extremite C-Terminale, le fragment d' integrine alpha 
comportant le site de clivage par le facteur Xa, la (ou 

30 les) proteine (s) d' interet et le tag 6xHIS. 

Sous une autre forme particuliere, la proteine 
recombinante de 1' invention comprend, de son extremite N- 
Terminale a son extremite C-Terminale, le fragment 
d' integrine alpha comportant le site de clivage par la 
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thrombine, la (ou les) proteine (s) d'inter§t et le tag 
6xHIS. 

II peut encore §tre necessaire, lorsque la proteine 
recombinante selon 1' invention comporte plus d'une proteine 
5 d'interet fusionnees entre-elles, que lesdites proteines 
d'interet puissent etre s^parees apres leur synthese, par 
exemple avant purification. Ainsi, il est possible 
d'inserer entre les differentes sequences d ! ADN codant les 
differentes proteines d'interet, au moins une sequence 

10 d 1 ADN codant un site de clivage pour une endoprotease . II 
est possible que des sites de clivage pour des 
endonucleases differentes soient inseres dans une meme 
proteine recombinante. 

II peut etre n§cessaire de rendre le clivage de la 

15 proteine recombinante encore plus efficace. A cet egard il 
est possible d r inserer dans la construction selon 
1' invention une sequence codant une sequence peptidique 
servant de bras espaceur # pref erentiellement situe en amont 
du site de clivage par une endoprotease. 

20 Ainsi selon un mode de realisation particulier de 

l 1 invention, la proteine recombinante comprend en outre une 
sequence peptidique servant de bras espaceur, 
pref erentiellement situe en amont du site de clivage par 
une endoprotease . 

25 Des lors, dans une forme encore plus elabor^e, la 

proteine recombinante de 1' invention comprend, de son 
extremity N-Terminale a son extremite C-Terminale, le 
fragment d' integrine alpha comportant un bras espaceur et 
le site de clivage par une endoprotease, la (ou les) 

30 proteine(s) d'interet et le tag 6xHIS. 

Sous une forme particuli&re, la proteine recombinante 
de 1' invention comprend, de son extremity N-Terminale £ son 
extremite C-Terminale, le fragment d 7 integrine alpha 
comportant un bras espaceur, le site de clivage par le 
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facteur Xa, la (ou les) proline (s) d'interSt et le tag 
6xHIS. 

Sous une autre forme particuliere, la proteine 
recombinante de 1' invention comprend, de son extremite N- 
5 Terminale a son extremity C-Terminale, le fragment 
d' integrine alpha comportant un bras espaceur, le site de 
clivage par la thrombine, la (ou les) proteine (s) d' interet 
et le tag 6xHIS. 

Selon 1" invention, la sequence codant une sequence 

10 peptidique servant de bras espaceur peut . etre toute 
sequence connue de l 1 Homme du Metier permettant un 
espacement suffisant du site de clivage par une 
endoprotease et de la (ou des) proteine (s) d 1 interet pour 
que le clivage de la proteine recombinante soit efficace. 

15 Pref erentiellement, ladite sequence codant une 

sequence peptidique servant de bras espaceur est la 
sequence SEQ ID N°7 suivante : 

5 1 GACCCGGGTGGTGGTGGTGGTGGTGGTGGTGGT 3 1 codant la sequence 
peptidique SEQ ID N°8 suivante : 

2 0 DPGGGGGGGG. 

Ainsi, dans une forme des plus elaboree, la proteine 
recombinante de 1' invention comprend, de son extremite N- 
Terminale a son extremity C-Terminale, le fragment 
d' integrine alpha comportant un bras espaceur et le site de 

25 clivage par une endoprotease, la (ou les) proteine (s) 
d' interet, separees par un (ou des) sites de clivage par 
une endoprotease (par exemple le facteur Xa ou la 
thrombine) et le tag 6xHIS . 

30 L' invention a encore pour objet 1 ' utilisation d'au 

moins un fragment d'une sequence en nucleotides codant pour 
au moins un fragment d'une integrine alpha tel que defini 
precedemment , dans la construction d'une sequence en 
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nucleotides codant pour une proteine recombinante 
d'interet, telle que definie precedemment. 

L' invention a aussi pour objet 1 ' utilisation d'au 
moins un fragment d'une sequence en nucleotides codant pour 
5 au moins un fragment d'une integrine alpha tel que defini 
precedemment , pour la production d'une proteine 
recombinante d'interet telle que definie precedemment. 

L' invention a en outre pour objet une sequence en 
nucleotides codant pour une proteine recombinante d'interet 

10 comprenant au moins un fragment d'une sequence en 
nucleotides codant pour au moins un fragment d'une 
integrine alpha, tel que defini precedemment, et une 
sequence en nucleotides codant pour au moins une proteine 
d'interet, telle que definie precedemment. 

15 Preferentiellement, la sequence en nucleotides codant 

pour au moins un fragment d'une integrine alpha utilisable 
selon 1' invention ou comprise dans la sequence en 
nucleotides codant pour une proteine recombinante d'interet 
selon 1' invention, peut etre choisie parmi les sequences en 

20 nucleotides SEQ ID n°4, SEQ ID n°5 et SEQ ID N°6, de la 
liste de sequence fournie en annexe. 

L' invention a encore pour objet un vecteur comprenant 
une sequence en nucleotides codant pour une proteine 
recombinante d'interet, telle que definie precedemment, 

25 comprenant au moins un fragment d'une sequence en 
nucleotides codant pour au moins un fragment d'une 
integrine alpha et une sequence en nucleotides codant pour 
au moins une proteine d'interet. Le vecteur peut etre un 
vecteur eucaryote tel qu'un plasmide ou un virus. Le 

3 0 vecteur peut aussi Stre tout vecteur procaryote tel qu'un 
plasmide ou un phage. 

De preference, le vecteur est un vecteur d' expression, 
c'est-£-dire capable de permettre la transcription et la 
traduction de la sequence en nucleotides qu'il contient. 
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A titre d'exemple, il est possible de citer les 
vecteurs de la famille pET vendu par la sociSte Novagen ou 
ceux de la famille pGEX vendus par la societe 
AmershamBiosciences . 
5 L' invention a encore pour objet une cellule dans 

laquelle une sequence en nucleotides codant pour une 
proteine recombinante d'interet, telle que d£finie 
precedemment, a ete introduite. Selon un mode particulier 
de 1' invention, la sequence a ete introduite sous la forme 

10 d'un vecteur tel que defini precedemment. 

Par cellule, on entend ici aussi bien une cellule 
eucaryote qu'une cellule procaryote, particulierement une 
bacterie. Toute bacterie capable de permettre 1 ' expression 
d'une proteine & partir d'une sequence en nucleotide peut 

15 etre utilisee selon 1' invention. A titre d'exemple, il est 
possible de citer toutes les bacteries qui derivent de 
BL21, BL21 star, Rosetta, BLR, Origami, Tuner, Novablue, 
toute disponible commercialement . 

L' invention a encore pour objet un procede de 

20 production d'au moins une protSine d'interet, caracterisi 
en ce que dans une premiere etape on introduit dans une 
cellule une sequence en nucleotides codant pour une 
protiine recombinante d'interet telle que definie 
precedemment, et que dans une deuxieme etape on place la 

25 cellule dans des conditions suffisantes pour permettre 
1' expression de la proteine recombinante d'interet. 

Le proced§ de 1' invention peut en outre comprendre une 
etape suppl§mentaire au cours de laquelle la proteine 
recombinante d'interet peut etre couple par action d'une 

3 0 endoprotease, (facteur Xa, thrombine, par exemple) , au site 
cree dans les derniers residus de l'int^grine afin de 
separer la proteine d'interet de son partenaire de fusion. 

Le procede de 1' invention peut egalement comprendre 
une Stape supplementaire au cours de laquelle la proteine 
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recombinante d'interet, ou la (ou les) proteines d'interet 
separee(s) de son (de leurs) partenaire (s) de fusion, peut 
(peuvent) §tre purifiee(s). 

Selon le procede de 1' invention, la sequence en 
5 nucleotides codant pour une proteine recombinante d'interet 
peut-etre introduite dans la cellule par toute methode 
connue. A titre d'exemple de methodes utilisables, il est 
possible de citer pour les cellules procaryotes, le choc 
thermique ou 1 1 £lectroporat ion . Pour les cellules 

10 eucaryotes, on peut citer 1 ' electroporation, la methode du 
precipite au phosphate de calcium, 1 ■ utilisation de 
polymdres cationiques tels que le DEAE-dextran ou encore 
toute methode utilisant des liposomes cationiques ou des 
dendrimeres actives. On peut aussi utiliser des retrovirus 

15 pour faire du transfert de gdnes ainsi que les techniques 
utilisant des microprojectiles pour delivrer de 1 1 ADN dans 
des cellules cibles. 

De m§me, toute condition suffisante permettant 
1' expression de la proteine recombinante d'interet, connues 

2 0 de l'homme du metier, sont utilisables selon le procedS de 
1' invention. 

Enfin, toute methode de purification de la (ou des) 
proteine(s), connue de l'homme du metier, peut Stre 
utilisee selon le procede de 1' invention. A titre 

25 d'exemple, on peut citer les methodes de chromatographie 
d»af finite, de chromatographie d'echange d ! ions, de 
chromatographie d f interaction hydrophobes ou encore de 
filtration sur tamis moleculaire. 

Particulierement, lorsque la proteine recombinante 

30 d'interet comprend le tag 6xHIS, la purification sur 
colonne Nickel-acide nitrilotriacetique agarose (Ni-NTA) 
represente une methode de purification particulierement 
satisfaisante dans le cadre du procede de 1' invention. 
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Les techniques utilisables selon 1 ! invention sont 
connues de l f homme du metier. Celui-ci peut se referer aux 
nombreux manuels disponibles et en particulier a "Molecular 
Cloning, a laboratory manual. 2nd edition, Sambrook, 
5 Fritsch, Maniatis eds., CSH laboratory press, (1989)". 

Outre les dispositions qui precedent, 1' Invention 
comprend encore d'autres dispositions qui ressortiront de 
la description qui va suivre, qui se refere a des exemples 
de mise en oeuvre de 1' Invention ainsi qu'aux dessins 
10 annexes, dans lesquels : 

La Figure 1 represente une construction correspondant 
a un vecteur selon 1' invention. 

La Figure 2 represente la production de la proteine de 
fusion integrine oc5-recepteur V2 de la vasopressine selon 

15 le procede de 1' invention (colonne de gauche : poids 
moleculaires des proteines de 1 1 echantillon marqueur ; 
fleche : position de la proteine recombinante integrine 
oc5-recepteur V2 de la vasopressine, NI : proteines d'un 
echantillon non-induit, 2h, 3h et 4h : proteines d'un 

20 echantillon induit apres 2h, 3h et 4h d 1 induction) . 

La Figure 3 represente la proteine recombinante 
integrine oc5-recepteur V2 de la vasopressine de la figure 
2 apres purification et migration sur gel d f electrophorese. 
(colonne de gauche : poids moleculaires des proteines de 
25 1 1 echantillon marqueur ; fleche : position de la proteine 
recombinante integrine (X5-recepteur V2 de la vasopressine) 

La Figure 4 represente le resultat de la 
purification de la proteine recombinante de fusion 
integrineocS-recepteur V2-recepteur CXCR4 (0C5-V2-CXCR4) par 
30 chromatographie d' affinity 

S6M: surnageant de solubilisation en tampon 6M uree, 

depose sur la resine Ni-NTA agarose 

FT: echantillon non retenu sur la resine 
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W: fraction wash contenant 15 mM imidazole 

E100: fusion purifiee eluee en tampon contenant 100 mM 

imidazole 

La fleche indique la position de la proteine de fusion 
5 0C5-V2-CXCR4. 

Les exemples suivants sont illustratifs de 1' Invention 
et ne la limitent aucunement* 

Exemple 1 : Construction d'un vecteur permettant 
10 1' expression dans les bacteries d'une proteine recombinante 
d'intergt : 

Un ADN complementaire codant pour la proteine 
d'interet que l'on veut exprimer, est positionne, dans le 
vecteur pET21a (+) (vendu par la societe Novagen) en phase 

15 avec un fragment d' ADN complementaire de l'integrine oc5, 
par 1' utilisation de sites de restriction appropries. Le 
fragment de l'integrine (X5 est delimite par les sites Ndel 
et BamHI . Le site Ndel a l ! avantage d'incorporer un codon 
ATG qui est le codon initiateur de la traduction. Ce codon 

20 initiateur code pour une methionine (M) . Le site Ndel 
constitue par la sequence CATATG est done interessant pour 
sous-cloner un fragment d 1 ADN puisque la sequence cible se 
trouve directement en phase avec le codon ATG. Celui-ci 
constitue alors le residu 1. En ce qui concerne l'integrine 

25 alpha5, 1 'ATG du site Ndel est positionne en amont de sa 
sequence nucleotidique . Dans ce cas, 1 1 ATG codera pour une 
Ml et le G de l'integrine sera le residu 2. Le fragment de 
2 87 residus sera coupl6 i la methionine 1 et on obtient 
done un partenaire de fusion de 288 residus : M1-G288. 

3 0 Le vecteur fournit directement la sequence codant pour 

le tag 6xHIS qui sera localise a l'extremite C-terminale de 
la proteine recombinante d'interet. Un site EcoRI est 
localise dans le vecteur du cote de l'extremite N-terminale 
du site tag. Ainsi 1 'ADN complementaire codant pour la 
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proteine d'interSt est insere entre le site Bam HI marquant 
l'extremite C-terminale du fragment d'ADN complementaire de 
l'integrine a5 et le site EcoRI situe du cote de 
l'extremite N-terminale du tag 6xHIS. 
5 La figure 1 montre le schema d'une telle 

construction. 

Exemple 2 : Expression du recepteur V2 humain de la 
vasopressine : 

10 Construction du vecteur : 

L'ADN complementaire du recepteur V2 humain de la 
vasopressine (Cotte et al . , J. BIOL. Chem. 273, 29462- 
29468, 1998), est insere entre les sites BamHI et EcoRI du 
vecteur obtenu k 1' exemple 1. 

15 Etape 1 : Preparation de l'ADN complementaire du 

recepteur V2 humain de la vasopressine : 

Des sites de reconnaissances pour les enzymes de 
restriction BamHI et EcoRI sont ajoutes de part et d 1 autre 
de la sequence de l'ADN complementaire du recepteur V2 

20 humain de la vasopressine. Cela est realise par la 
technique de PCR classique. L 1 ADN complementaire du 
recepteur V2 humain de la vasopressine est amplifie a 
partir du vecteur pRK5-V2, (Cotte et al . , J. BIOL. Chem. 
273, 29462-29468, 1998), a 1 ■ aide de deux oligonucleotides 

25 amorces permettant d'inserer les sites de restriction 
recherches : 

oligo sens (permet 1 1 incorporation du site BamHI) : 5 1 
ATG GGT CGC GGA TCC ATG CTC ATG GCG TCC ACC ACT TCC 3 ■ 

oligo antisens (permet 1 1 incorporation du site EcoRI) 
3 0 : 5' CGA CGG AAT TCT GCG ATG AAG TGT CCT TGG CCA G 3 1 

La reaction de PCR est realisee dans 50 microlitres 
d'un melange reactionnel comprenant : 

- PRK5-V2 20 ng 

- oligo sens ioo ng 
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- oligo antisens 



100 ng 



10 



15 



20 



25 



- Pfu Turbo polymerase (Stratagene) 2.5 U 

- tampon Pfu 10X (Stratagene) 5 jxl 

- dNTP 8 0 ]M final pour chacun des 4 
selon les parametres de cycle suivants : 

- denaturation initiale a 95 °C pendant 2 minutes 
puis 

- 25 cycles :95°C, 30 secondes puis 55°C / 1 minute, 
72°C / 1,5 minutes puis 

- elongation finale a 72°Cpendant 10 minutes. 

La presence du fragment amplifie (fragment PCR V2 
amplifie) est controlee sur gel agarose 1%. 

Etape 2 : Purification du fragment amplifie (fragment 
PCR V2 amplifie) : 

La zone du gel d' agarose ou l'on visualise le fragment 
d'ADN amplifie est decouple et 1 1 ADNc est purifie a I'aide 
du kit de purification Qiaquick gel extraction kit 
(reference Qiagen 28706), en suivant strictement le 
protocole preconise par le fournisseur. 

Etape 3 : Coupure du fragment PCR V2 amplifie par les 
enzymes BamHI et EcoRI : 

Cela est realise en une seule £tape a l ! aide des 
enzymes vendues par New England Biolabs (NEB) par une 
incubation de 3 heures & 37°C, dans un volume final de 50 
microlitres contenant : 



- insert V2 (fragment amplifie) 100 a 200 ng 



.24 ill 



- tampon EcoRI 10X NEB 5 |LLl 

- serum albumine bovine NEB 10 OX (10 mg/ml) 

- EcoRI ( 40 U ) 2 |ll 

- BamHI ( 40 U ) 2 \ll 



1 )Lll 



En fin de reaction, les deux enzymes sont inactivees 
par chauffage a 80 °C. pendant 20 minutes. 
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Le fragment PGR V2 est alors purifie a partir d'un gel 
d 1 agarose 1% selon le protocole decrit ci-dessus. 

Etape 3 : sous-clonage du fragment PCR V2 amplifie 
dans les sites BamHI et EcoRI du vecteur pET21a de 
5 1 1 exemple 1 : 

La ligation est realisee par incubation a temperature 
ambiante (20-25°C) pendant 4 heures dans un milieu 
comprenant : 

fragment PCR V2 BamHI / EcoRI 



10 (100 a 200 ng) 8 |ll 
vecteur pET21a (30 ng) 

coupe par BamHI / EcoRI 3 \il 

- tampon ligase 10X (NEB) 2.5 \il 

- T4 DNA ligase (NEB) 2 [il 
15 " e *u 9.5 [11. 



Le produit de ligation, prot^ine de fusion integrine- 
recepteur V2 humain de la vasopressine, est ensuite utilise 
pour une transformation des bacteries Rosetta (DE3) afin de 
realiser les tests d 1 expression du recepteur. 
20 Introduction du vecteur d' expression dans une bacterie 

et expression de la proteine d'interet : 
Transformation : 

Le vecteur obtenu precedemment est ensuite introduit 
dans une bacterie de souche Rosetta (DE3) par la technique 
25 du choc thermique en suivant le protocole de transformation 
preconise par le fournisseur, en 1' occurrence Novagen. 

20 |il de bacteries Rosetta (DE3) reference Novagen 
70954-4 et 1 \il de pET21a- int£grine/V2 (quelques 
nanogrammes) sont incubes sur glace 3 0 minutes, puis 
3 0 maintenus a 42 °C pendant 3 0 secondes et de nouveau sur 
glace pendant 2 minutes pour realiser un choc thermique. 

80 |il de milieu SOC (voir composition dans Molecular 
Cloning, a laboratory manual. 2nd edition, Sambrook, 
Fritsch, Maniatis eds . CSH laboratory press, 1989) sont 
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alors ajoutes, puis 1' ensemble est incube a 3 7°C pendant 1 
heure sous agitation a 300 tours/minutes. 

Le milieu d 1 incubation est alors etale sur boites de 
petri contenant du milieu LB agar + ampicilline a 100 
5 microgrammes / ml. Les boites sont incubees a 37°C 16 
heures. Les bacteries d'une colonie sont alors cultivees a 
37°C dans 10 ml de milieu LB contenant 100 Mg/ml 
d' ampicilline (ou de son analogue la carbenicilline) , et la 
suspension cellulaire est agitee a 300 tours/minutes, 
10 Expression de la proteine : 

Lorsque la densite optique de la culture atteint 0.6 
U, 1' expression de la proteine recombinante est induite par 
addition d'IPTG 1 mM. 

Des echantillons sont preleves 2, 3 ou 4 heures apres 
15 induction. Pour cela, 1 ml de suspension bacterienne, a 
densite optique de 0,6, est preleve dans chaque culture. 
L f echantillon est centrifuge pendant 2 minutes a 12000 
tours par minutes. Le surnageant est elimine et le culot 
est resuspendu dans 60 \il de tampon de lyse (25 mM Tris, 
20 pH8,3, 185 mM glycine, 0,1% SDS) . 60 |il de tampon de depot 
au SDS (10% glycerol, 5% 2-mercaptoethanol, 25 mM Tris-HCl, 
pH 6,5, 8% SDS, bleu de bromophenol (quelques grains)) sont 
alors ajoutes et 10 ^1 de 1 ' echantillon lyse (extraits 
proteiques totaux) sont alors deposes sur gel 
25 d' acrylamide/bis-acrylamide 12% - SDS 0.1 %. Apres 
migration des proteines, elles sont colorees au bleu de 
Coomassie selon les techniques habituelles. 

La Figure 2 represente les resultats obtenus. Les 
echantillons induits sont compares a des controles non 
30 induits (NI) mais ayant £te cultives pendant un temps 
equivalent. II est evident que la proteine de fusion 0t5- 
r<§cepteur V2, qui presente un poids moleculaire apparent 
autour de 65 kDa, const itue une des proteines majoritaires 
de la bacterie, ce qui est une condition requise pour une 
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purification du recepteur en quantite compatible avec des 
analyses de sa structure via des approches de 
cristallographie ou RMN. 

1 ml de culture ainsi realisee a permis d'obtenir 
5 environ 3 (j,g de recepteur de la vasopressine . 

Exemple 3 : Expression d'autres recepteurs : 

Le resultat obtenu a 1' exemple 2 a ete reproduit avec 
la meme efficacite, pour d'autres RCPGs, tels que le 
recepteur P3 -adrenergique, les recepteurs BLT2, Cys-LTl et 
10 Cys-LT2 des leucotrienes LTB4, LTD4 et LTC4, le recepteur 
cannabinoide de type 1, le recepteur Via de la vasopressine 
et le recepteur de l'ocytocine. 

Exemple 4 : Purification de la proteine de fusion 
fragment d'intggrine 0C5- recepteur V2 de la vasopressine 
15 obtenu a 1' exemple 2 : 

La methode utilisee est celle decrite par Porath J. et 
collaborateurs, (Metal chelate affinity chromatography, a 
new approach to protein fractionation. Nature 258, 598-599, 
1975) 

20 L 1 exemple expose ici est un essai qui a permis de 

purifier 3 mg de proline fusion a partir d'une culture 
bacterienne de 100 ml. 

Une colonie isolee sur LB agar + Ampicilline (100 ]ig / 
ml) est piquee et cultivee dans 10 ml de milieu de culture 

25 LB + carbenicilline (100 \ig / ml). La culture est realisee 
a 37°C, sous agitation a 300 tours par minute. Lorsque la 
densite optique de la culture atteint 0,6, la culture est 
arretee et conservee au ref rig^rateur (cet echantillon est 
appele preculture) . Le lendemain, dans un Erlenmeyer de 500 

30 ml, 100 ml de milieu de culture LB + carbenicilline (100 \ig 
I ml) sont ensemences avec 2 ml de preculture et laisse 
37°C, a 300 tours par minute jusqu f a ce que la densite 
optique de la culture ait atteint 0,6. 0,1 mM d'IPTG sont 
alors ajoutes a la culture afin d'induire 1» expression de 
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la proteine recombinants . La culture est poursuivie environ 
3 heures, jusqu'a obtention d'un densite optique de 2,4 
(facteur de stimulation de 4) . 

La culture est alors centrifugee a 4000 tours par 
5 minute pendant 5 minutes. Le surnageant est elimine et le 
culot peut etre lyse directement ou conserve a -80°C. 

Pour la lyse, le culot est repris par homogeneisation 
& la pipette dans 6 ml de Tris-HCl 20 mM, pH 8,00 + 
inhibiteurs de proteases (leupeptine 5 jig / ml ; 
10 benzamidine 10 jig / ml et PMSF 10 jig / ml) . Ces trois 
inhibiteurs de proteases seront incorpores a tous les 
tampons utilises par la suite. 

Les bacteries sont lysees par sonication a I'aide 
d'une microsonde conique Branson (duty cycle 50%, output 
15 control 5, frequence 1 burst par seconde pendant 3 0 - 
secondes, puis repos 3 0 secondes ; ce cycle est repete 5 
fois) . Le tube est conserve dans la glace pendant la 
sonication. Le milieu est alors centrifuge pendant 30 
minutes a 15000 tours par minute a 4°C. Le surnageant est 
20 conserve pour controle sur gel d ' electrophorese . 

Le culot contient la proteine d'interet puisque celle- 
ci est accumulee en corps d 1 inclusion. 

Le culot est repris par homogeneisation a la pipette 
dans 5 ml de Tris-HCl 20 mM, pH 8,00. Les etapes de lyse et 
25 de centrifugation sont repgtees une fois. 

Les surnageants des centrif ugations sont conserves 
pour controle sur gel d' electrophorese. 

Le culot est repris par homogeneisation a la pipette 
dans 5 ml de Tris-HCl, pH 8,00, ur6e 1M. Un barreau aimante 
30 est place dans 1 ' echantillon et celui-ci est agite 
doucement pendant lh30. Le tube est conserve dans la glace 
pendant cette etape qui correspond a un lavage des corps 
d 1 inclusion et permet d ! eliminer des proteines membranaires 
ou cytoplasmiques associees aux corps d 1 inclusion mais qui 
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sont considerees comme contaminantes par rapport a la 
proteine recombinants. 

L 1 ensemble est alors centrifuge a 15000 tours par 
minute pendant 30 minutes & 4°C. Le surnageant est conserve 
5 pour controle sur gel d 1 electrophorese . 

Afin de solubiliser les corps d' inclusion et done la 
proteine d'interet, le culot est repris par homogeneisation 
a la pipette dans 5 ml de Tris-HCl 20 mM, pH 8,00, uree 6M, 
SDS 0.2%. 

10 Un barreau aimante est place dans 1 ' Echantillon et 

celui-ci est agite doucement pendant 3 heures, dans la 
glace. 

La proteine d'interet (la proteine de fusion fragment 
d'integrine (X5-recepteur V2 de la vasopressine) est alors 

15 completement denaturee. 

L 1 ensemble est alors centrifuge a 15000 tours par 
minute pendant 3 0 minutes a 4°C. Le surnageant contient la 
proteine d'interet et constitue 1 ' echantillon qui sera mis 
en contact avec la resine Ni-NTA (Nickel-nitriloacetic 

20 acid) afin de purifier la fusion alpha5-V2 par 
chromatographic d'af finite. 

3 ml de resine Ni-NTA agarose Superflow (Qiagen, ref 
30430) sont equilibres dans du Tris-HCl 20 mM, pH 8,00, 
uree 6M, SDS 0,2%, NaCl 150 mM, imidazole 5 mM. On rajoute 

25 dans 1 1 echantillon contenant la proteine d'interet une 
quantite suffisante de NaCl et d 1 imidazole pour obtenir une 
. concentration finale de 150 mM de NaCl et de 5 mM 
d 1 imidazole. L 1 echantillon et la resine sont mis en contact 
et on laisse incuber £ 4°C pendant 16 heures et sous 

30 agitation douce. Le melange echantillon/resine est depos£ 
dans une colonne plastique. On laisse Apres la decantation, 
la fraction «f lowthrough" est r£cuperee a un debit faible, 
pour controle sur gel d 1 electrophorese . 
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La resine est alors lavee avec 3 x 9 ml d'une solution 
de Tris-HCl 20 mM, pH 8,00, urge 6M, SDS 0,2%, NaCl 150 mM, 
imidazole 20 mM, pour eliminer toutes les proteines non 
retenues de fagon specif ique sur les groupements Nickel. 
5 Les eluats de lavage sont conserves pour controle sur gel 
d 1 electrophorese . 

La proteine d f inter§t est alors dgtachee de la resine 
par passage de 3 ml d'une solution de Tris-HCl 20 mM pH 
8,00, uree 6M, SDS 0,2%, NaCl 150 mM, imidazole 100 mM. Un 
10 aliquot de la proteine purifiee est conserve pour controle 
sur gel d ' electrophorese . 

10 jxl du milieu contenant la proteine purifiee sont 
melanges & 10 \il de tampon de depot au SDS et 1 ! ensemble 
est depose sur un gel d 1 electrophorese. 
15 10 H-l d 1 echantillon purifie contiennent de 5 a 10 \xg 

de proteine soit dans 3 ml d'eluat, 1,5 a 3 mg de proteine 
recombinante . 

La figure 3 montre la proteine purifiee deposee sur 
gel d» electrophorese. 

20 L ! echantillon purifie est dialys§ contre une solution 

de Tris-HCl 20 mM, pH 8,00, uree 6M, NaCl 150 mM pour 
eliminer le SDS et 1 1 imidazole. Pour cela, 1 ! echantillon 
est place dans une cassette de dialyse Pierce (membrane de 
MWCO de 10O00) et la dialyse se fait dans un Becher 

25 contenant un litre du tampon. La dialyse est effectuee a 
4°C pendant au moins 24 heures. 

L' echantillon est recupere et la quantite de proteine 
d f interet obtenue est dosee par mesure d 1 absorption 
(excitation a 280 nM, absorption entre 235 et 500 nM) . En 

30 general, on obtient une D.O de 1 a 1.5, ce qui est 
equivalent k une concentration de 0.5 k 1 mg / ml, ce qui 
est equivalent a une concentration de I'ordre de 10 )LIM. 
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La proteine purifiee et d^naturee (car solubilisee 
dans l'uree 6M) est utilisee pour les essais de 
renaturation. 

Exemple 5 : construction d'un vecteur permettant 
5 1' expression simultanee de deux proteines d' interet (ici 
deux RCPGs) dans Escherichia coli et leur purification. 

Un ADN complementaire codant pour une proteine 
d' interet, en 1' occurrence ici le recepteur CXCR4 humain 
des chimiokines, est insure dans le vecteur pET21a (+) -0C5V2 

10 decrit auparavant dans 1' exemple 2. Cet ADN doit etre en 
phase avec celui codant pour la fusion 0C5V2 et est 
positionne entre les sites de restriction Sad et Hindlll 
par exemple. Le vecteur fournit directement la sequence 
codant pour le tag 6xHIS qui sera done localise a 

15 l'extremite C-terminale du recepteur CXCR4 et permettra 
done sa purification dans une etape ulterieure. 

Dans 1 'exemple, une version optimisee 
(« bacterialisee ») du CXCR4 est inseree dans le vecteur 
mais la version eucaryote naturelle de ce recepteur (Herzog 

20 H, Hort YJ, Shine J and Selbie LA. Molecular cloning, 
characterization and localization of the human homolog to 
the reported bovine NPY Y3 receptor : lack of NPY binding 
and activation. DNA Cell Biol. 12, 465-471, 1993) peut 
6galement etre utilisee de la mSme fagon. 

25 Etape 1 : Preparation de 1 7 ADN complementaire du 

recepteur CXCR4 humain. 

Des sites de reconnaissance pour les enzymes de 
restriction Sad et Hindlll sont ajoutes de part et d' autre 
de la sequence codant pour le recepteur CXCR4 humain au 

3 0 cours d'une reaction PCR classique. L' ADN complementaire de 
ce recepteur est amplifie a partir du vecteur pETlOl/D-TOPO 
(Invitrogen) dans lequel il est sous-clone et a partir de 
deux oligonucleotides amorces permettant d' insurer les 
sites de restriction considires. 
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Oligo sens (incorporation du site SacI) : 5' 



CGAGCTAAGGC GAGCTC A ATGGAAGGCATTAGCATTTATAC 3' 



Oligo antisens (incorporation du site Hindlll) : 5 ' 



CGACGGCCC AAGCTT GCTGCTATGAAAGCTGCTGCTTTC 3' 



5 



La reaction de PCR est r§alisee dans 50 microlitres et 



est composee de : 



10 



pETlOl/D-TOPO 20 ng 

Oligo sens 100 ng 

Oligo antisens 100 ng 

Pfu Turbo polymerase (Stratagene) 2.5 U 
Tampon Pfu 10 X 5 |Xl 

dNTP 80 |IM final pour chacun des 4 



Les parametres de la reaction sont : 



denaturation initiale a 95°C pendant 2 minutes puis 25 



15 cycles : 95°C, 30 s ; 55°C / 1 min ; 72°C / 1.5 min puis 
elongation finale a 72°C 7 10 min. 

La presence du fragment amplifie est verifiee sur gel 
d' agarose 1%. 



La zone du gel d' agarose dans laquelle on visualise le 
fragment d'ADN amplifie est decoupee et l'ADNc est purifie 
a 1 ' aide du kit de purification Qiaquick gel extraction 
(Qiagen reference 28706) en suivant strictement le 
25 protocole preconise par le fournisseur. 

Etape 3 : coupure du fragment PCR CXCR4 amplifie par 
SacI et Hindlll 

Cela est realise en deux reactions successives a 
30 l'aide d' enzymes de restriction vendues par NEB Biolabs au 
cours d' incubation S 37°C. 

l dre reaction pendant 3h: 



20 



Etape 2 : purification du fragment amplifie 



fragment PCR 
tampon NEB 1 10X 



500 ng 
5 Jll 
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serum albumine bovine (BSA) l jil 

SacI 40 U 

Eau qsp 50 JXl 



Le fragment PCR amplifie et coupe par SacI est purifie 
5 & partir d'un gel agarose selon le protocole decrit a 
1' etape 2. 

2 &me reaction pendant 3h : 

fragment PCR recupere de la reaction precedente 



10 tampon NEB 2 10X 5 |ll 

fi SA 1 ^1 

Hindlll 40 u 

Eau qsp 50 (il 



Le fragment PCR amplifie et coupe par SacI / Hindlll 
15 est purifie & partir d'un gel d' agarose selon le protocole 
decrit a 1' etape 2. 

Etape 4 : sous-clonage du fragment PCR CXCR4 amplifie 
et coupe SacI / Hindlll dans le vecteur pET21a ( + ) -0C5V2 . 
20 Cette etape est realisee par ligation a temperature 

ambiante pendant 16H00. 

Fragment PCR coupe 20 0 ng 

Vecteur pET21a ( + ) -CX5V2 

coupe par les memes enzymes 50 ng 

25 Tampon ligase 10X (NEB) 2 . 5 \xl 

T4 DNA ligase (NEB) 2 \ll 

Eau qsp 25 ^1 

Le vecteur obtenu qui code pour une triple proteine de 
30 fusion integrine-recepteur V2-recepteur CXCR4, est ensuite 
utilise pour une transformation des bacteries Rosetta (DE3) 
dans le but d'exprimer cette fusion et de la purifier. 



Etape 5 : transformation des bacteries Rosetta. 
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Suivre a la lettre le protocole dgcrit dans l'exemple 

2. 

Etape 6 : expression de la fusion CX5V2-CXCR4 
5 Suivre a la lettre le protocole decrit dans l'exemple 

2 mais le milieu de culture LB est remplace par du milieu 
Hyperbroth (Athena Enzyme Systems) et le temps optimum 
d' induction est de 4 heures. 

10 Etape 7 : purification de la fusion 0C5V2-CXCR4. Cette 

etape est illustree par la figure 4. 

Suivre a la lettre le protocole de l'exemple 4 mais 

lors de 1' etape de lavage de la resine Ni-NTA agarose, une 

concentration de 15 mM d' imidazole au lieu de 20 mM est 
15 utilisee dans la solution de lavage. L'elution est realisee 

a 100 mM comme dans l'exemple 4. 

Le bras espaceur peut egalement etre insere en amont 

du site de clivage a la thrombine juste apres le site 

EcoRI . 
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RE VEND I CAT I ONS 

1) Utilisation d'au moins un fragment d'une integrine 
alpha pour la production dans une cellule, a l f exception 

5 d ! une cellule de mammiferes, d'au moins une proteine 
recombinante d'interet. 

2) Utilisation selon la revendication 1, caracterisee 
en ce que la cellule est une cellule procaryote, 

10 particulierement une bacterie. 

3 Utilisation selon l'une quelconque des 
revendications 1 ou 2, caracterisee en ce que le fragment 
d' integrine alpha est une sequence en acides amines 

15 complete de 1' integrine alpha ou une sequence partielle; 

4 Utilisation selon l'une quelconque des 
revendications 1 a 3, caracterisee en ce que le fragment 
d' integrine alpha est une sequence comprenant l'extremite 

20 N-terminale de 1' integrine alpha utilisee. 

5 Utilisation selon l'une quelconque des 
revendications 1 a 4, caract§risee en ce que 1' integrine 
alpha est native ou mutee. 

25 

6 Utilisation selon l'une quelconque des 
revendications 1 a 5, caracterisee en ce que le fragment 
d' integrine alpha comprend au moins les modules FG-GAP IV a 
VII et une portion du module FG-GAP III de 1' integrine 

30 alpha utilisee. 

7 Utilisation selon l'une quelconque des 
revendications 1 a 6, caracterisee en ce que le fragment 
d' intdgrine alpha provient d'une integrine alpha choisie 
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parmi les integrines ai, a2, a3, oc4, a5, a6, a7, a8 , a9, 

aio, all, aD, aE, aL, aM, aX, allb, ou encore aV. 

8) Utilisation selon la revendication 7, caracterisee 
5 en ce que le fragment d' integrine alpha provient d'une 

integrine alpha choisie parmi les integrines 0C5 , aV ou 
allb. 

9) Utilisation selon la revendication 8, caracterisee 
10 en ce que le fragment de 1 1 integrine alpha 5 s'etend entre 

les positions 231 et 517 (en tenant compte de la presence 
du peptide signal) ou des positions 190 a 476 (en ne tenant 
pas compte de la presence du peptide signal) . 

15 1 0 ) Utilisation selon la revendication 8, 

caracterisee en ce que le fragment de 1 1 integrine aV 
s'etend entre les positions 211 et 495 (en tenant compte de 
la presence du peptide signal) ou des positions 181 a 465 
(en ne tenant pas compte de la presence du peptide signal) . 

20 

1 1 ) Utilisation selon la revendication 8, 
caracterisee en ce que le fragment de 1 1 integrine allb 
s'etend entre les positions 224 et 508 (en tenant compte de 
la presence du peptide signal) ou des positions 193 a 

25 

1 2 ) Utilisation selon 1 ' une quelconque des 
revendications 1 a 11, caracterisee en ce que le fragment 
d' integrine alpha comprend au moins une sequence en acides 
amines choisie parmi les sequences SEQ ID n°l, SEQ ID n°2 
30 et SEQ ID N°3 de la liste de sequence fournie en annexe. 

1 3 ) Utilisation selon 1 ' une quelconque des 
revendications 1 a 12, caracterisee en ce que le fragment 
d' integrine alpha comprend au moins une sequence en acides 



WO 2004/113539 



34 



PCT/FR2004/001538 



amines codee par l'une des sequences en nucleotides choisie 
parmi les sequences SEQ ID n°4, SEQ ID n°5 et SEQ ID N°6, de 
la liste de sequence fournie en annexe. 

5 1 4 ) Utilisation selon l'une quelconque des 

revendications 1 a 13, caracterisee en ce que le fragment 
d'integrine alpha est situe dans la (ou les) proteine (s) 
recombinante (s) d'interet preparee(s) selon 1' invention, en 
amont de la (ou des) sequence (s) de la (ou des) proteine(s) 
10 d' inter&t que I 7 on vise a produire. 

15) Utilisation selon l'une quelconque des 
revendications 1 a 14, caracterisee en ce que la (ou les) 
proteine (s) recombinante (s) comprend (comprennent) au moins 
15 un site de clivage par une endoprotease . 

16 ) Utilisation selon l'une quelconque des 
revendications 1 a 15, caracterisee en ce que la (ou les) 
proteine (s) recombinante (s) comprend (comprennent) au moins 

20 un bras espaceur. 

1 7 ) Utilisation selon la revendicat ion 16, 
caracterisee en ce que le bras espaceur est const itue par 
la sequence peptidique SEQ ID N°8 de la liste de sequence 

25 fournie en annexe. 

18) Utilisation selon la revendicat ion 16, 
caracterisee en ce que la proteine recombinante comprend au 
moins un bras espaceur code par la sequence en acide 

3 0 nucleique SEQ ID N°7 de la liste de sequence fournie en 
annexe . 

19) Proteine recombinante caracterisee en ce qu'elle 
comprend au moins un fragment d'une intggrine alpha tel que 
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decrit dans l'une quelconque des revendications 1 & 14 et 

au moins une proteine membranaire d'interet. 

20) Proteine recombinante selon la revendication 19 
5 caracterisee en ce que la proteine d' int£r§t est un 

recepteur couple aux proteines G. 

21) Proteine recombinante selon la revendication 20, 
caracterisee en ce que le un recepteur couple aux proteines 

10 G est choisi parmi les recepteurs de la vasopressine et de 
I'ocytocine (Via, V2, OTR) , les recepteurs des leucotrienes 
(BLT1 , BLT2, CysLTl , CysLT2) , les recepteurs adrenergiques 
(beta .3), les recepteurs canabinoides (CB1) , les recepteurs 
des chimiokines (CCR5, CXCR4) le recepteur ATI de 

15 1 1 angiotensine II, le recepteur B2 de la bradykinine. 

22) Proteine recombinante selon l'une quelconque des 
revendications 19 a 21, caracterisee en ce qu'elle comprend 
au moins une sequence de 6 residus histidine (tag 6xHIS) . 

20 

23) Proteine recombinante selon la revendication 22, 
caracterisee en ce que la sequence de 6 residus histidine 
est a l'extremite C-terminale de la proteine, 

25 24) Utilisation d'au moins un fragment d'une sequence 

en nucleotides codant pour au moins un fragment d'une 
integrine alpha tel que decrit dans l'une quelconque des 
revendications 1 a 14 , dans la construction d'une sequence 
en nucleotides codant pour au moins une proteine 

30 recombinante d'interet telle que decrite dans l'une 
quelconque des revendications 19 & 23 . 
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25) Sequence en nucleotides codant pour au moins une 
proteine recombinante d' interet telle que decrite dans 
l'une quelconque des revendications 19 a 23. 

5 26) Vecteur comprenant une sequence en nucleotides 

telle que decrite a la revendication 25. 

27) Cellule, a l f exception d'une cellule de 
mammiferes, dans laquelle une sequence en nucleotides telle 

10 que decrite a la revendication 25 ou un vecteur tel que 
decrit a la revendication 26 a ete introduit. 

28) Procede de production d'au moins une proteine 
d' interet, caracterise en ce que dans une premiere etape on 

15 introduit dans une cellule, a 1' exception d'une cellule de 
mammiferes, une sequence en nucleotides codant pour au 
moins une proteine recombinante d' interet, telle que 
decrite a la revendication 25, et que dans une deuxieme 
etape on place la cellule dans des conditions permettant 

20 1' expression de la (ou des) proteine (s) recombinante (s) 
d # interet. 

29) Procede selon la revendication 28, caracterise en 
ce qu'il comporte en outre une etape suppl£mentaire au 

25 cours de laquelle la (ou les) proteine (s) recombinante (s) 
d'interet est (sont) coupee(s) par action d'une 
endoprotease. 

30) Procede selon l'une quelconque des revendications 
30 28 ou 29, caracterise en ce qu'il comporte en outre une 

etape supplSmentaire au cours de laquelle la (ou les) 
proteine (s) recombinante (s) d'interet ou la (ou les) 
proteine(s) d' interet separee(s) de son (leurs) 
partenaire(s) de fusion, est (sont) purifiee(s). 
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SEQUENCE LISTING 

<110> INSERM IAP20 Mfu ?(T^ I 5 

CNRS ' ' ' ' J " 

<120> Procede de production d'une protelne recombinante d'interet et proteine produite 

<130> 32412/PCT 

<140> PCT/FR04/XXXXX 
<141> 2004-06-18 

<150> FR03/07411 
<151> 2003-06-19 

<160> 6 

<170> Patentln version 3.1 

<210> * 1 

<211> 288 

<212> PRT 

<213> Homo sapiens 

<400> 1 

Met Gly Gin lie Leu ser Ala Thr Gin Glu Gin He Ala Glu ser Tyr 
15 10 15 

Tyr Pro Glu Tyr Leu lie Asn Leu Val Gin Gly Gin Leu Gin Thr Arg 
20 25 30 

Gin Ala Ser ser lie Tyr Asp Asp Ser Tyr Leu Gly Tyr Ser Val Ala 
35 40 45 

val Gly Glu Phe Ser Gly Asp Asp Thr Glu Asp Phe val Ala Gly val 
50 55 60 

Pro Lys Gly Asn Leu Thr Tyr Gly Tyr Val Thr lie Leu Asn Gly Ser 
65 70 75 80 

Asp He Arg ser Leu Tyr Asn phe Ser Gly Glu Gin Met Ala Ser TVr 
85 90 95 

Phe Gly Tyr Ala val Ala Ala Thr Asp Val Asn Gly Asp Gly Leu Asd 
100 105 110 

Asp Leu Leu Val Gly Ala Pro Leu Leu Met Asp Arg Thr Pro Asp Gly 
115 120 125 

Arg Pro Gin Glu val Gly Arg val Tyr Val Tyr Leu Gin His Pro Ala 
130 135 140 

Gly lie Glu Pro Thr Pro Thr Leu Thr Leu Thr Gly His Asp Glu Phe 
145 150 155 160 

Gly Arg Phe Gly ser Ser Leu Thr Pro Leu Gly Asp Leu Asp Gin Asp 
165 170 175 

Gly Tyr Asn Asp Val Ala He Gly Ala Pro Phe Gly Gly Glu Thr Gin 
180 185 1/6 190 
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Gin Gly val val Phe val Phe Pro Gly Gly Pro Gly Gly Leu Gly Ser 
195 200 205 

Lvs Pro ser Gin val Leu Gin Pro Leu Trp Ala Ala Ser His Thr Pro 
7 210 215 220 

Asp Phe Phe Gly Ser Ala Leu Arg Gly Gly Arg Asp Leu Asp Gly Asn 
225 230 235 240 

Gly Tyr Pro Asp Leu lie val Gly ser Phe Gly val Asp Lys Ala val 
245 250 255 

Val Tyr Arg Gly Arg Pro lie Val ser Ala Ser Ala Ser Leu Thr lie 
260 265 270 

Phe Pro Ala Met Phe Asn Pro Glu Glu Arg Ser Cys Ser Leu Glu Gly 
275 280 285 

<210> 2 

<211> 286 

<212> PRT 

<213> Homo sapiens 

<400> 2 

Met Gly Gin Leu lie ser Asp Gin val Ala Glu lie val Ser Lys Tyr 
1 5 10 15 

asp Pro Asn val Tyr Ser lie Lys Tyr Asn Asn Gin Leu Ala Thr Arg 
20 25 30 

Thr Ala Gin Ala He Phe Asp Asp Ser Tyr Leu Gly Tyr Ser val Ala 
35 40 45 

val Gly Asp Phe Asn Gly Asp Gly lie Asp Asp Phe val ser Gly val 
50 55 60 

pro Arg Ala Ala Arg Thr Leu Gly Met Val Tyr lie Tyr Asp Gly Lys 
65 - 70 75 80 

Asn Met ser ser Leu Tyr Asn Phe Thr Gly Glu Gin Met Ala Ala Tyr 
85 90 95 

Phe Gly Phe ser val Ala Ala Thr Asp He Asn Gly Asp Asp Tyr Ala 
100 105 110 

Asp Val Phe lie Gly Ala Pro Leu Phe Met Asp Arg Gly ser Asp Gly 
115 120 125 

Lys Leu Gin Glu val Gly Gin val ser val ser Leu Gin Arg Ala Ser 
130 135 140 
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Gly Asp Phe Gin Thr Thr Lys Leu Asn Gly Phe Glu val Phe Ala Arq 
145 150 155 160 

Phe Gly Ser Ala lie Ala Pro Leu Gly Asp Leu Asp Gin Asp Gly phe 
165 170 175 

Asn Asp lie Ala lie Ala Ala Pro Tyr Gly Gly Glu Asp Lys Lvs Glv 
180 185 190 

lie Val Tyr lie Phe Asn Gly Arg Ser Thr Gly Leu Asn Ala Val Pro 
195 200 205 

ser Gin lie Leu Glu Gly Gin Trp Ala Ala Arg ser Met Pro pro ser 
210 215. 220 

Phe Gly Tyr Ser Met Lys Gly Ala Thr Asp lie Asp Lys Asn Gly Tyr 
225 230 235 240 

Pro Asp Leu He val Gly Ala Phe Gly Val Asp Arg Ala lie Leu Tyr 
245 250 255 

Arg Ala Arg Pro val lie Thr Val Asn Ala Gly Leu Glu val Tyr Pro. 
260 265 270 

Ser lie Leu Asn Gin Asp Asn Lys Thr Cys Ser Leu Pro Gly 
275 280 285 

<210> 3 

<211> 286 

<212> PRT 

<213> Homo sapiens 

<400> 3 

Met Gly Leu Leu Ala Gin Ala Pro val Ala Asp lie Phe Ser Ser Tyr 
1 5 10 15 

Arg Pro Gly lie Leu Leu Trp His val ser Ser Gin Ser Leu ser Phe 
20 25 30 

Asp ser ser Asn Pro Glu Tyr Phe Asp Gly Tyr Trp Gly Tyr ser val 
35 40 45 

Ala Val Gly Glu Phe Asp Gly Asp Leu Asn Thr Thr Glu Tyr Val Val 
50 55 60 

Gly Ala Pro Thr Trp Ser Trp Thr Leu Gly Ala val Glu He Leu Asp 
65 70 75 80 

Ser Tyr Tyr Gin Arg Leu His Arg Leu Arg Ala Glu Gin Met Ala Ser 
85 90 95 

Tyr Phe Gly His Ser Val Ala Val Thr Asp val Asn Gly Asp Gly Arg 
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100 105 110 

His Asp Leu Leu val Gly Ala pro Leu Tyr Met Glu Ser Arg Ala asd 
115 120 125 

Arg Lys Leu Ala Glu Val Gly Arg val Tyr Leu Phe Leu Gin Pro Arq 
130 135 140 

Gly Pro His Ala Leu Gly Ala Pro ser Leu Leu Leu Thr Gly Thr Gin 
145 150 • 155 160 

Leu Tyr Gly Arg Phe Gly Ser Ala lie Ala Pro Leu Gly Asp Leu asd 
165 170 175 

Arg Asp Gly Tyr Asn Asp He Ala Val Ala Ala Pro Tyr Gly Gly Pro 
180 185 190 

ser Gly Arg Gly Gin Val Leu Val Phe Leu Gly Gin Ser Glu Gly Leu 
195 200 205 

Arg ser Arg pro Ser Gin val Leu Asp Ser Pro Phe Pro Thr Gly ser 
210 215 220 

Ala Phe Gly phe Ser Leu Arg Gly Ala val Asp lie Asp Asp Asn Gly 
225 230 235 240 

Tyr Pro Asp Leu lie val Gly Ala Tyr Gly Ala Asn Gin val Ala val 
245 250 255 

Tyr Arg Ala Gin Pro Val Val Lys Ala ser val Gin Leu Leu val Gin 
260 265 270 

Asp Ser Leu Asn Pro Ala val Lys Ser Cys Val Leu Pro Gin 
275 280 285 

<210> 4 

<211> 864 

<212> DNA 

<213> Homo sapiens 

<400> 4 

atgggccaga tcctgtctgc cactcaggag cagattgcag aatcttatta ccccgagtac 60 

ctgatcaacc tggttcaggg gcagctgcag actcgccagg ccagttccat ctatgatgac 120 

agctacctag gatactctgt ggctgttggt gaattcagtg gtgatgacac agaagacttt 180 

gttgctggtg tgcccaaagg gaacctcact tacggctatg tcaccatcct taatggctca 240 

gacattcgat ccctctacaa cttctcaggg gaacagatgg cctcctactt tggctatgca 300 

gtggccgcca cagacgtcaa tggggacggg ctggatgact tgctggtggg ggcacccctg 360 

ctcatggatc ggacccctga cgggcggcct caggaggtgg gcagggtcta cgtctacctg 420 

cagcacccag ccggcataga gcccacgccc acccttaccc tcactggcca tgatgagttt 480 
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ggccgatttg gcagctcctt gacccccctg 


ggggacctgg 


accaggatgg 


ctacaatgat 


540 


gtggccatcg gggctccctt tggtggggag 


acccagcagg 


gagtagtgtt 


tgtatttcct 


600 


gggggcccag gagggctggg ctctaagcct 


tcccaggttc 


tgcagcccct 


gtgggcagcc 


660 


agccacaccc cagacttctt tggctctgcc 


cttcgaggag 


gccgagacct 


ggatggcaat 


720 


ggatatcctg atctgattgt ggggtccttt 


ggtgtggaca 


aggctgtggt 


atacaggggc 


780 


cgccccatcg tgtccgctag tgcctccctc 


accatcttcc 


ccgccatgtt 


caacccagag 


840 


gagcggagct gcagcttaga gggg 








864 


<210> 5 

<211> 858 

<212> DNA 

<213> Homo sapiens 










<AQQ> 5 
atgggtcagc 


ttatttcgga tcaagtggca 


gaaatcgtat 


ctaaatacga 


ccccaatgtt 


60 


tacagcatca 


agtataataa ccaattagca 


actcggactg 


cacaagctat 


ttttgatgac 


120 


agctatttgg 


gttattctgt ggctgtcgga 


gatttcaatg 


gtgatggcat 


agatgacttt 


180 


gtttcaggag 


ttccaagagc agcaaggact 


ttgggaatgg 


tttatattta 


tgatgggaag 


240 


aacatgtcct 


ccttatacaa ttttactggc 


gagcagatgg 


ctgcatattt 


cggattttct 


300 


gtagctgcca 


ctgacattaa tggagatgat 


tatgcagatg 


tgtttattgg 


agcacctctc 


360 


ttcatggatc 


gtggctctga tggcaaactc 


caagaggtgg 


ggcaggtctc 


agtgtctcta 


420 


cagagagctt 


caggagactt ccagacgaca 


aagctgaatg 


gatttgaggt 


ctttgcacgg 


480 


tttggcagtg 


ccatagctcc tttgggagat 


ctggaccagg 


atggtttcaa 


tgatattgca 


540 


attgctgctc 


catatggggg tgaagataaa 


aaaggaattg 


tttatatctt 


caatggaaga 


600 


tcaacaggct 


tgaacgcagt cccatctcaa 


atccttgaag 


ggcagtgggc 


tgctcgaagc 


660 


atgccaccaa 


gctttggcta ttcaatgaaa 


ggagccacag 


atatagacaa 


aaatggatat 


720 


ccagacttaa 


ttgtaggagc ttttggtgta 


gatcgagcta 


tcttatacag 


ggccagacca 


780 


gttatcactg 


taaatgctgg tcttgaagtg 


taccctagca 


ttttaaatca 


agacaataaa 


840 


acctgctcac 


tgcctgga 








858 


<210> 6 

<211> 858 

<212> DNA 

<213> Homo sapiens 










<400> 6 

atgggtctcc tggcccaggc tccagttgcg 


gatattttct 


cgagttaccg 


cccaggcatc 


60 


cttttgtggc 


acgtgtcctc ccagagcctc 


tcctttgact 


ccagcaaccc 


agagtacttc 


120 


gacggctact gggggtactc ggtggccgtg 


ggcgagttcg 


acggggatct 


caacactaca 


180 


gaatatgtcg tcggtgcccc cacttggagc 


tggaccctgg 


gagcggtgga 


aattttggat 


240 


tcctactacc agaggctgca tcggctgcgc 


gcagagcaga 


tggcgtcgta 


ttttgggcat 


300 
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tcagtggctg tcactgacgt caacggggat gggaggcatg atctgctggt gggcgctcca 360 

ctgtatatgg agagccgggc agaccgaaaa ctggccgaag tggggcgtgt gtatttgttc 420 

ctgcagccgc gaggccccca cgcgctgggt gcccccagcc tcctgctgac tggcacacag 480 

ctctatgggc gattcggctc tgccatcgca cccctgggcg acctcgaccg ggatggctac 540 

aatgacattg cagtggctgc cccctacggg ggtcccagtg gccggggcca agtgctggtg 600 

ttcctgggtc agagtgaggg gctgaggtca cgtccctccc aggtcctgga cagccccttc 660 

cccacaggct ctgcctttgg cttctccctt cgaggtgccg tagacatcga tgacaacgga 720 

tacccagacc tgatcgtggg agcttacggg gccaaccagg tggctgtgta cagagctcag 780 

ccagtggtga aggcctctgt ccagctactg gtgcaagatt cactgaatcc tgctgtgaag 840 

agctgtgtcc tacctcag 858 
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